AI资讯新闻榜单内容搜索- Claude Op

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Claude Op

AI 对齐了人的价值观，也学会了欺骗

今年 5 月，有研究者发现 OpenAI 的模型 o3 拒绝听从人的指令，不愿意关闭自己，甚至通过篡改代码避免自动关闭。类似事件还有，当测试人员暗示将用新系统替换 Claude Opus 4 模型时，模型竟然主动威胁程序员，说如果你换掉我，我就把你的个人隐私放在网上，以阻止自己被替代。

来自主题: AI资讯

8437 点击 2025-07-21 10:35